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摘 要 : 针对 海量 多 源 异 构 且 数据 分 布 不 平衡 的 网 络 入 侵 检 测 问 题 以 及 传统 深度 学 习 算 法 无 法 根据 实时 入 侵 情 况 在 
线 更 新 其 输出 权重 的 问题 ， 提 出 了 一 种 基于 深度 序列 加 权 核 极限 学 习 的 入 侵 检 测算 法 (DBN-WOS-KELM 算法 )。 该 
算法 先 使 用 深度 信念 网 络 DBN 对 历史 数据 进行 学 习 ， 完 成 对 原始 数据 的 特征 提取 和 数据 降 维 ， 再 利用 加 权 序 列 核 
极限 学 习 机 进行 监督 学 习 完 成 入 侵 识 别 ， 结 合 了 深度 信念 网 络 提取 抽象 特征 的 能 力 以 及 核 极限 学 习 机 的 快速 学 习 能 
力 。 最 后 在 KDD99 部 分 数据 集 上 进行 了 仿真 实验 ， 实 验 结果 表明 DBN-WOS-KELM 算法 提高 了 对 小 样本 攻击 的 识 
别 率 ， 并 且 能 够 根据 实际 情况 在 线 更 新 输出 权重 ， 训 练 效 率 更 高 。 

关键 词 : 深度 信念 网 络 ; 序列 学 习 ; 核 极 限 学 习 ; 样本 加 权 ; 入 侵 检 测 
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Intrusion detection algorithm based on depth sequence weighted kernel extreme learning 


Wang Yang, Wu Zhongdong, Zhu Jing 
(School of Electronic & Information Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China) 


Abstract: This paper proposed a intrusion detection algorithm based on deep sequence weighting kernel limit learning 
(DBN-WOS-KELM) to solve the problem of massive multi-source heterogeneous network intrusion detection with 
unbalanced data distribution and the problem that the traditional deep learning algorithm can not update its output weight 
online according to the real-time intrusion situation. The algorithm first uses the deep belief network DBN to study the 
historical data, then extracts the features of the original data and reduces the dimension of the data, and then uses the 
weighted sequence kernel extreme learning machine for supervised learning to complete the intrusion detection. It combines 
the ability of extracting Abstract features from the deep belief network and the fast learning ability of the kernel extreme 
learning machine. Finally, the simulation experiments on KDD99 dataset show that DBN-WOS-KELM algorithm improves 
the recognition rate of small sample attacks, and can update the output weights online according to the real-time situation, so 
that the training efficiency is much higher. 


Key words: deep belief network; sequence learning; kernel extreme learning; sample weighting; intrusion detection 


实时 入 侵 数 据 在 线 更 新 其 输出 权重 的 问题 ， 对 深度 信念 网 络 


引 语 和 序列 核 极 限 学 习 机 进行 了 深入 研究 ， 提 出 了 
入 侵 检测 技术 是 信息 网 络 领域 不 可 缺少 的 部 分 ， 随 着 人 EN Os CEM A 
sg 能 技术 的 不 断 深入 ， 深 度 学 习 算 法 相对 于 传统 的 机 器 学 。 ”提取 数据 特征 的 能 力 和 序列 核 极 限 学 习 机 的 泛 化 能 力 。 


DBN 
最 后 


习 入 侵 检测 算法 具有 识别 率 高 ， 误 报 率 低 的 优势 ， 在 入 侵 检 ”通过 KDD99 部 分 数据 集 进 行 有 效 评估 ， 实 验 结果 表明 ， 本 
测 领 域 应 用 广泛 。 高 妮 等 人 趾 提 出 了 深度 信念 网 络 的 入 侵 检 ，”” 文 算法 不 仅 提 高 了 对 小 样本 攻击 的 检测 率 ， 还 能 根据 实际 情 
测算 法 ,Ambusaidi 等 人 3 提出 了 基于 DBN-SVM 的 混合 入 侵 。 况 在 线 更 新 分 类 器 参数 ， 进 一 步 提 高 了 训练 效率 。 


检测 算法 ,未 玉 婧 、 杨 昆 朋 B4 提 出 了 基于 深度 学 习 的 混合 入 站 
侵 检测 模型 ， 得 到 的 实验 结果 在 准确 率 和 误 报 率 上 均 优 于 传 1 DBN-WOS-KELM 入 侵 检测 模型 

统 的 机 器 学 习 入 侵 检测 算法 。 但 是 现 阶段 学 习 算法 未 考虑 到 ”1.1 方法 总 体 架 构 

参与 训练 的 网 络 历史 入 侵 数据 分 布 的 不 平衡 性 ， 只 强调 了 高 本 文 提出 了 DBN-WOS-KELM 的 入 侵 检测 算法 , 总 体 框 
检测 率 和 低 误 报 率 ， 导 致 了 小 样本 攻击 类 别 大 部 分 被 识别 为 。” 架 如 图 1 所 示 ， 具 体 步骤 如 下 : 

大 样本 攻击 类 别 ， 对 小 样本 攻击 类 别 的 检测 准确 率 不 高 。 针 a) 数 据 预 处 理 。 将 网 络 数据 中 的 字符 特征 转换 成 对 应 的 
对 此 类 不 平衡 数据 的 学 习 分 类 问题 ，Zong 等 人 器 提 出 了 加 权 。 ”二进制 数据 ， 再 均值 化 到 [0,1]。 

极限 学 习 算法 处 理 不 平衡 数据 。Mirza 在 研究 了 序列 学 习 的 b)DBN 抽象 特征 提取 。 分 为 RBM 的 无 监督 预 训练 以 及 
优势 ， 提 出 了 加 权 在 线 极限 学 习 机 的 不 平衡 数据 学 习 算 法 以 BP 微调 全 局 ， 对 网 络 数据 进行 降 维 。 

及 加 权 的 序列 核 极 限 学 习 算 法 (67, 实验 结果 表明 小 样本 数据 c)WOS-KELM 分 类 器 识别 入 侵 。 将 降 维 后 的 数据 打上 数 
识别 大 幅度 增加 。 本 文 针对 网 络 入 侵 数 据 的 多 源 异 构 以 及 各 ” 据 标 签 作为 可 靠 数据 并 进行 样本 加 权 , 通过 KELM 的 序列 学 
攻击 类 别 的 分 布 不 平衡 特性 以 及 传统 深度 学 习 算法 无 法 根据 。” 习 ， 学 习 完 成 后 取代 BP 作为 分 类 器 。 
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dIDBN-WOS-KELM 识别 入 侵 。 将 网 络 历史 入 侵 数 据 降 WeW+e(p(h =1|v)v -ph = 
维 后 进行 样本 加 权 后 进行 入 侵 检测 ， 识 别 出 其 入 侵 类 型 。 Cectelw—v,) 
1 "Blywos kta PT 


一 2 权 值 微调 (Gui 区 


' 
' 7 全 一 全) 一 Ce | | 为 使 整个 DBN 网 络 达到 全 局 最 优 , 通过 BP 网 络 利用 少 
| 是 贞 实 可 能 扩 等 此 如 簿 请 各 惰 JRBM 参数 ， 将 预测 人 与 实 
! | 际 标签 天 专 播 至 每 一 层 ， 具 体 步 又 如 
| 1 算 靶 2 所 
| 最 | 合法 
NSL-KDD 数 据 集 w3|eca dwil dcl RBM3 四 输入 : 预 训练 后 的 DBN 参数 0={Wib,c} ,训练 样本 < v ,1>， 
I | 最 炎 迄 代 次 数 | 
A | Le@@…@@ | 输出 | 德 哺 站 的 他 B 贿 数 g -wa 。 
' i | ' wz|o duwz|uo RBM2 | 检测 1 让 练 阶段 ， 好 符 ， 和 生生 六 HeN 的 重 构 输出 洲 ， 反 向 传播 误 
[I®660. S60 | 
1 (WR 人 re) 1 | | 1 对 每 个 输出 单元 计 特 W 差 6、: | 
有 ! ' wl| ua dW3 dc3 | RBMI 入 侵 类 现 识 别 ， | 
CK XXXHXYXY» ' ' 车 个 隐藏 层 单元 册 Py | 
RRR] 一 ~- 一 -CC 
图 1 DBN-WOS-KELM 总 体 框 架 Reman 
工 Fig. 1 The overall framework of DBN-WOS-KELM 更 新 参数 : 
> ”1.2 DBN 特征 降 维 0 =0; +AO; 
深度 信念 网 络 是 一 种 由 多 层 RBM 和 一 层 BP 网 络 构成 的 其 中 Ab =76)x; ，7 为 学 习 率 。 
生成 性 深度 结构 ， 最 先 由 Hinton 提出 名， 如 图 1 步骤 b) 所 1.3 WOS-KELM 分 类 器 
示 ， 其 训练 过 程 可 分 解 如 下 两 步 : 加 权 序 列 和 极限 学 习 机 (WOS-KELM)W 是 加 权 序 列 学 习 
1) RBM 预 训练 算法 与 加 权 核 极限 学 习 机 算法 (WKELM) 外 的 结合 ， 由 Shuya 
RBM 的 结构 如 图 2 所 示 , 分 为 输入 层 和 隐藏 层 两 层 。 其 Ding 等 人 提出 。 与 序列 核 极限 学 习 机 (OS-KELM)H1 类 似 ,， 训 
参数 为 96={W,b,c} 。 练 过 程 分 成 初始 化 阶段 和 序列 学 习 阶 段 两 个 阶段 。 
en 0 初始化 阶段 
WOS-KELM 的 初始 化 阶段 与 WELM 学 习 算 法 类 似 ， 首 
先 选 择 初始 训练 数据 mm = 人 0 i=1.…N。。 确 定 隐 藏 层 初 始 化 
输出 矩阵 为 
po = (AE + EE) = RD (1) 
0 R=(HHT + ey CO) 
、 Fig.2 The structural model of RBM C 
-十 其 中 4 是 输入 层 到 隐藏 层 的 偏 置 ，c 是 隐藏 层 到 输入 层 的 偏 . a 1 1 ) 
置 ，W 是 可 见 层 到 隐藏 层 节点 的 连接 权重 和 矩阵，w” 和 为 是 分 器 鹃 wh, 
别 表示 两 层 神 经 元 的 状态 。RBM 的 训练 算法 是 Hinton 提出 定义 HH8 =Qaw ，9aomw =K(%,x)) ，K(x,y) 为 核 函数 ,为 
的 对 比 散 度 学 习 算 法 N90， 算法 过 程 如 下 : 样本 标签 矩阵 ，cC 为 正则 化 系数 ，W 为 第 一 批 训 练 样本 的 权 
算法 1 对 比 散 度 学 习 算 法 重 和 矩阵 ， 文 献 [7] 给 出 了 Ww 的 计算 方法 
和 输入， 训练 样本 加 ， 隐 践 层 神经 元 个 数 加 ， 学 习 率 & ， 最 大 连 代 i 
次 数 T 。 
输出 ，RBM 参数 9={W,b,c} 。 w =1/m, (5) 
训练 阶段 ， w= 罗 ， 随机 初始 化 9 式 (4) 中 N 表示 训练 样本 的 数量 , x 表示 第 上 条 属于 第 : 
对 所 有 隐藏 层 单元 : 类 标签 的 训练 样本 , m 表示 训练 数据 中 第 i 类 标签 的 样本 数 
| 目 。 
es 2) 序 列 学 习 阶段 
从 条 件 分 布 PUn =1|w) 中 抽取 加 s(0.D 当 第 一 批 训练 数据 为 =(4,) ，i=12,.…,N 参与 训练 时 , 更 
对 所 有 可 见 层 单元 : 新 核 极限 学 习 机 的 输出 矩阵 8® 为 
计算 p(w =1|h)=o(c+ DWyhj) Fam i | 和 
从 条 件 分 布 p(w =1| 及 ) 中 抽取 we (0,D | 四 人 
对 所 有 隐藏 层 单元 ; 下 
计算 p(w) =1|w)=o(b; + DwiW;) Wr doe 局 本 让 | 07) 


更 新 参数 : 定义 =HHY， Ko=HoH?， Ko=HH?Y, 则 
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-1 
天 0 十 W 天 0 
及 C 
1 
,Wr! 
(Ko) 天 0o+ 
-| 局 Own 下 
ON wm Ow, Ni ly, 


Kt (Ko RKOLCRKG) I] 


式 (8) 中 0w 表示 mx 阶 零 矩阵 ， 


态 代 表 mxm 


当 第 上 +1 批 训练 数据 参与 训练 时 ， 


| 及 Ow Nis | | 
Rn = 直 x 
Own On, mis Ty,, 
， Wal ， ， ， 
(CK 十 C —(K.) RK) [CRK')T 7 ] 
本 了 
R= (Ki +) 
为 了 表达 简便 ， 定 义 
Qn =-RK. 


Hen = (K+ = +(K') Qn 
将 式 (11)(12) 代 入 式 (9) 中 得 到 
Ri -| Ke Ovw wa | 
ON Nes Ty,, 


Onn 
x(pu) [QF Ty] 


最 后 得 到 第 t+1 批 次 输出 矩阵 的 更 新 
(KH) 一 1 
ad 
.=[z . ny 


将 式 (14)(15) 代 入 式 (13) 中 得 到 
Bu -| + Qe Hn) (Ten | 
(Ka) Tea- (Ki) B®) 


2 实验 


2.1 数据 集 预 处 理 
本 次 实验 采用 的 数据 集 是 KDD99 数据 集 D2， 


异常 类 型 分 成 了 四 大 类 ，, 分别 是 DOS、R2L、U2R、 
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(8) 


阶 单位 入 


TOGT 


(9) 


(10) 


(11) 
(12) 


(13) 


(14) 


(15) 


(16) 


数据 集 将 
Probe ， 


潜 


含有 39 种 攻击 方式 。 训 练 集 中 包含 了 22 种 攻击 方式 ， 测 试 


集中 还 包含 了 17 种 训练 集中 未 出 现 的 攻击 方式 〈 
用 )。 


数据 集 有 41 维特 征 , 其 中 包含 J 
练 和 检测 前 先进 行 预 处 理 ， 首 先 将 字符 数据 转换 成 


字符 型 和 数字 型 ,在 训 


实验 未 使 


二 进 制 向 


量 。 例 如 标签 类 型 normal、DOS、R2L、U2R、Probe 表示 为 


[0,0,0,0,1]、[0,0,0,1,0]、[0,0,1,0,0]、[0,1,0,0,0]、[1,0,0,0,0]。 


字符 数据 映射 完成 之 后 进行 数据 均值 化 处 理 ， 将 各 


维 数据 归 


一 化 到 0 到 1 之 间 ， 转 换 公 式 如 下 : 
__y-MIN 
~ MAX—MIN 
2.2 实验 评价 标准 
传统 的 入 侵 检测 算法 通常 强调 整体 高 准确 率 ， 


(17) 


以 及 低 误 


报 率 , 忽略 了 小 样本 攻击 的 检测 , 本 文 实验 除 采 用 准确 率 AC 
以 及 误 报 率 FA 作为 各 类 攻击 检测 评价 标准 以 外 ， 还 采用 几 
何平 均 数 G6 09 作 为 整体 检测 结果 的 评价 标准 ， 如 式 
(18)~(20) 所 示 。 
T,+Ty 
AC (18) 


T+ tb,+P, 
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F 


一 pb 


T+ 


L 这 
Gm = 人 一) 


ja 3 


有 .OH 


确 分 类 的 个 数 ， 
示 攻 击 样本 误 报 为 正常 的 个 数 ，” 表示 第 j 类 攻击 检 


中 : Tv 表示 正常 样本 正确 分 类 的 个 数 ，T 表示 攻击 样本 正 
表示 正常 样本 误 报 为 攻击 的 个 数 ， 
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(19) 


(20) 


肥 表 
# 本 总 数 ， 


5; 表示 检测 准确 的 j 类 攻击 数 ，4 表示 样本 类 别 数 ,实验 数据 


共 5 类 ， 故 4 取 值 为 5。 

2.3 ”实验 参数 设置 
本 文 所 提出 的 模型 中 ，DBN 作为 数据 降 维 的 部 

络 层 数 的 设 定 至 关 重 要 ， 


因此 实验 前 必须 确定 其 深度 。 实 验 


分 ， 其 网 


20%， 测 试 集中 抽取 
情况 ， 根 据 式 (20) 计 算出 各 网 络 深度 下 的 Go ， 
大 原则 选用 DBN* (如 图 3 中 虚线 所 示 )， 


中 预 设 了 5 种 DBN' 结构 (i 表示 网 络 的 层 数 ), 分 类 器 使 用 BP 
网 络 ， 其 节点 参数 如 表 1 所 示 ， 从 KDD99 的 训练 集中 抽取 
10000 条 数据 ， 得 到 各 类 攻击 样本 检测 
根据 Cuw 最 
体检 测 结果 如 图 3。 


KELM 的 参数 (y,0) 设 定 为 2,2e9， 核 函数 为 高 斯 核 函数 ， 如 
式 (21) 所 示 。 
K(x,x)=exp(-7||x-% |), ry>0 (21) 
表 1 DBN 参数 
Table ] DBN parameter 
网 络 深度 节点 参数 
DBN! 122-30 
DBN? 122-100-30 
DBN3 122-100-70-30 
DBMN4 122-110-100-60-30 
DBN5 122-110-100-70-50-30 
DBNS 122-110-100-80-60-40-30 
100 1 
801 
= | 
凑 
洪 40 ] Normal 
一 人 一 DOS 
—— U2R 
一 一 R2L 
20 ] 一 人 一 Probe 
-和 Gmean 
1 2 3 4 5 6 
DBN 网 络 深度 : 
图 3 不 同 DBN 深度 下 的 检测 结果 
Fig.3 Test results at different DBN depths 
2.4 实验 结果 


2.4.1 DBN-WKELM 实验 


为 验证 不 同 训练 集 分 布 情况 下 的 检测 情况 ， 本 次 实验 从 


训练 集中 
集中 抽取 5 000 条 ， 分 别 讨 论 了 DBN，DBN-KELM 


取 了 4 组 不 同样 本 分 布 的 训练 子 数据 集 ， 


从 测试 
， 以 及 改 


进 后 DBN-WKELM 三 种 算法 对 5 种 攻击 的 检测 情况 以 及 检 


测 结果 的 G66。 实验 数据 分 布 情况 如 表 2 所 示 。 
表 2 训练 数据 分 布 
Table 2 Training data distribution 

Normal DOS U2R R2L Probe 
数据 集 1 2650 2150 10 140 400 
数据 集 2 3000 2500 11 200 350 
数据 集 3 2000 3000 8 180 500 
数据 集 4 1200 1200 11 200 1500 


录用 定稿 汪 洋 ， 等 : 基于 深度 序列 加 权 核 极限 学 习 的 入 侵 检测 算法 


各 攻击 样本 的 检测 情况 如 表 3~6 所 示 ， 据 式 (20) 计 
样本 检测 结果 的 Guw ， 结 果 如 图 4 所 示 。 实 验 结果 表明 
DBN-KELM 算法 比 原始 的 DBN 算法 检测 率 高 ， 对 久 
加 权 过 后 的 算法 DBN-WKELM 算法 在 尽 可 能 少 的 牺牲 的 大 
样本 攻击 类 型 的 检测 率 , 提高 了 对 小 样本 类 型 攻击 的 检测 率 ， 
F 均 数 Co 均 优 于 另 
外 两 种 算法 ， 弥 补 了 传统 入 侵 检 测算 法 对 大 样本 攻 


4 


在 4 个 训练 子 数据 集 下 检测 结果 的 几何 


HH 


别 率 高 而 对 小 样本 攻击 识别 率 低 的 缺陷 。 
表 3 数据 集 1 检测 结果 


Table 3 Testresult of data set 1 


| 练 样本 


和 类 型 


| 算出 
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表 7 批量 数据 分 布 情况 
Table7 The distribution of batch data 


击 样本 ”Normal DOS U2R R2L 


数据 含量 568 330 3 25 


I 识 


> 5 
a 
a 


图 6 给 出 了 DBN-WOS- 


算法 Normal DOS U2R R2L Probe 
DBN 95.93 95.90 55.00 78.72 88.52 
DBN-KELM 95.58 95.32 52.50 81.63 92.85 
DBN-WKELM 95.54 95.43 64.00 88.31 93.76 


图 5 给 出 了 随 着 训练 批 次 增加 各 个 攻击 类 型 的 检测 变化 
情况 ， 以 及 检测 结果 的 Guw 的 变化 情况 。 实 验 结果 表明 随 着 
练 批 次 的 增加 ， 各 类 攻击 样本 的 检测 率 逐 渐 趋 于 稳定 ， 检 
测 结果 的 6 也 依次 增加 ， 但 增加 的 速率 逐渐 降低 ， 分 > 
又 渐 稳定 。 证 明了 本 文 所 提出 的 DBN-WOS-KELM 算法 的 有 


法 在 相同 数据 量 下 的 训练 时 
据 量 的 情况 下 DBN-WOS-KELM 算法 的 训练 效率 明显 
DBN-WKELM 算法 。 
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表 4 数据 集 2 检测 结果 
Table 4 Test result of data set 2 


算法 Normal DOS U2R R2L Probe 
DBN 95.87 96.19 67.50 82.10 87.24 
DBN-KELM 95.90 96.38 67.50 81.48 94.44 
DBN-WKELM 95.44 95.82 83.50 90.52 90.62 


q 


表 5 数据 集 3 检测 结 
‘Table 5 Test result of data set 3 


准确 率 : 


算法 Normal © DOS U2R R2L Probe 
DBN 95.25 97.01 62.50 81.59 88.43 
DBN-KELM 95.18 97.73 69.00 ”82.61 94.30 
DBN-WKELM 93.95 95.88 74.50 93.28 95.00 


表 6 数据 集 4 检测 结 果 
Table6 Testresult of data set 4 
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图 5 DBN-WOS-KELM 检测 情况 


Fig.5 Detection situation of DBN-WOS-KELM 
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算法 Normal DOS U2R R2L Probe 
DBN 94.67 94.97 64.00 87.15 94.18 
DBN-KELM 95.15 95.16 71.50 86.56 96.32 
DBN-WKELM 93.94 94.85 85.00 90.49 94.88 
92 ] 
90 ] 
. 88 ] 
呈 86 ] 
84 ] 
一 一 DBN 
82 ] 一 @ 一 DBN-KELM 
—@— DBN-WKELM 
数据 集 1 数据 集 2 数据 集 3 数据 集 4 


训练 数据 集 
图 4 不 同 训练 数据 下 的 Cuw 对 比 


Fig.4 Comparison of Cu under different training data 


2.4.2 DBN-WOS-KELM 实验 


本 次 实验 中 从 KDD99 的 训练 集 抽 取 了 8000 条 数据 并 分 
成 8 个 数据 块 ， 从 测试 集中 抽取 了 5000 条 数据 (不 含 未 知 攻 
后 送 入 序 
列 核 极 限 学 习 机 (WOS-KELM) 中 训练 ， 依 次 更 新 核 极限 学 习 
机 的 输出 权重 bo ， 模 拟 现实 入 侵 检 测 系 统 在 线 更 新 过 程 ， 


击 形式 )， 训 练 过 程 中 将 各 个 数据 块 经 过 DBN 降 维 


各 数据 块 的 数据 含量 相同 ， 具 体 分 布 情况 如 表 7 所 示 。 训 练 


集中 U2R 含量 较 少 ， 采 取 自 我 复制 的 方法 。 
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了 6 DBN-WKELM 与 DBN-WOS-KELM 训练 时 
Fig.6 Training time of DBN-WKELM and DBN-WOS-KELM 


结束 语 


本 文 针 对 海量 多 源 异 构 且 数据 分 布 不 平衡 的 网 络 入 侵 检 
题 以 及 传统 深度 学 习 算 法 无 法 根 提 
其 输出 权重 的 问题 ， 提 出 了 一 利 
的 入 侵 检 测算 法 (DBN-WOS-KELM 算法 )。 该 算法 结合 


一 人 一 DBN-WOS-KELM 
一 @ 一 DBN-KELM 


初始 化 批 次 1 批 次 批 次 3 批 次 4 批 次 5 批 次 6 批 次 7 
训练 批 次 


到 | 


KELM 算法 与 DBN-WKELM 算 
间 曲 线 。 实验 结果 表明 在 同等 数 
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昌 实 时 入 侵 数 据 在 线 更 
深度 序列 加 权 核 极限 学 习 


录用 定稿 汪洋， 等 : 基于 深度 


DBN 特征 提取 和 KELM 快速 学 习 的 优势 ， 不 但 通过 样本 加 
权 解 决 了 数据 分 布 不 均衡 下 的 训练 问题 ， 在 尽 可 能 低地 降低 
大 样本 攻击 类 别 的 识别 率 的 前 提 下 提高 了 对 小 样本 攻击 的 识 
别 率 ， 而 且 能 够 在 新 的 训练 数据 到 来 时 在 原 输出 权重 的 基础 
上 在 线 更 新 其 输出 权重 。 最 后 在 KDD99 部 分 数据 集 上 进行 
了 实验 , 实验 结果 表明 DBN-WOS-KELM 算法 不 仅 对 各 类 型 
的 攻击 达到 了 较 高 的 识别 率 ， 还 能 根据 实际 情况 在 线 更 新 其 
输出 矩阵 ， 在 同等 数据 量 大 小 的 情况 下 ， 训 练 效 率 优 于 
DBN-WKELM 算法 。 但 本 文 仅仅 使 用 了 KDD9%9 部 分 数据 集 
验证 了 算法 的 可 行 性 ， 下 一 步 将 考虑 使 用 本 文 算法 解决 现实 
生活 中 的 入 侵 检 测 问题 。 
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